Floormod ================= 逐元素计算两个输入张量的 floor-modulus。 .. math:: \text{output}_i = \text{input0}_i - \lfloor \frac{\text{input0}_i}{\text{input1}_i} \rfloor \cdot \text{input1}_i 其中 :math:`\lfloor \cdot \rfloor` 表示向下取整 (floor) 操作。 输入: - **input0** - 第一个输入张量(被除数)的数据地址。 - **input1** - 第二个输入张量(除数)的数据地址。 - **size** - 输入张量的总元素数量。 - **core_mask** - 核掩码。 输出: - **output** - 输出张量的数据地址,其大小与输入张量相同。 支持平台: ``FT78NE`` ``MT7004`` .. note:: - FT78NE 支持fp32 - MT7004 支持fp16, fp32 **共享存储版本:** .. c:function:: void fp_floormod_s(float* input0, float* input1, float* output, int size, int core_mask) .. c:function:: void hp_floormod_s(half* input0, half* input1, half* output, int size, int core_mask) .. c:function:: void dp_floormod_s(double* input0, double* input1, double* output, int size, int core_mask) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 12 //FT78NE示例 #include #include int main(int argc, char* argv[]) { float *input0 = (float *)0xA0000000; // input0 在DDR空间 float *input1 = (float *)0xB0000000; // input1 float *output = (float *)0xC0000000; // output int size = 4096; int core_mask = 0xff; fp_floormod_s(input0, input1, output, size, core_mask); return 0; } **私有存储版本:** .. c:function:: void fp_floormod_p(float* input0, float* input1, float* output, int size) .. c:function:: void hp_floormod_p(half* input0, half* input1, half* output, int size) .. c:function:: void dp_floormod_p(double* input0, double* input1, double* output, int size) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 11 //FT78NE示例 #include #include int main(int argc, char* argv[]) { float *input0 = (float *)0x10000000; // input0 在L2空间 float *input1 = (float *)0x11000000; // input1 float *output = (float *)0x12000000; // output int size = 1024; fp_floormod_p(input0, input1, output, size); return 0; }